import pandas as pd
from sklearn.model_selection import train_test_split

from base import getEnvPath

path = getEnvPath()
# 设置数据文件路径
data_file = path + "data/output_dir//validation_data.csv"

# 读取CSV文件
data = pd.read_csv(data_file)  # 替换成你的文件名

# 1. 先均分为两部分（测试集和验证集）
X = data.drop(columns=["Label"])  # 特征（去掉Label列）
y = data["Label"]  # 标签（仅Label列）

# 均分（test_size=0.5表示50%划分）
X_test, X_val, y_test, y_val = train_test_split(X, y, test_size=0.5, random_state=42)

# 2. 保存拆分后的文件
X_test.to_csv(path + "data/output_dir/X_test.csv", index=False)
X_val.to_csv(path + "data/output_dir/X_val.csv", index=False)
y_test.to_csv(path + "data/output_dir/Y_test.csv", index=False)
y_val.to_csv(path + "data/output_dir/Y_val.csv", index=False)

print("拆分完成！")
